内存墙

“FP8 精度”如何赋能国产AI?

如今,大模型的算力饥渴与“内存墙”困境日益尖锐。模型参数规模指数级增长从千亿到了万亿,大模型的“膨胀速度”堪称“失控”:从BERT的3.4亿参数到GPT-3的1750亿,再到如今超万亿参数的模型,每两年参数规模增长约240倍。但GPU显存的增长却像“蜗牛爬”—

nvidia 内存带宽 浮点数 fp8 内存墙 2025-08-30 12:30  2